4有关最新实施大师级国际象棋程序的示例,而无需搜索,请参见Ruoss等。[RDM24]。此实现使用了大型(270 M参数)训练有素的神经网络位置评估器,并且非常适合在MPC-MC体系结构中使用;请参阅第4节。5用RL术语,我们可以将Q(x,u)视为对(x,u)的Q因子。我们采用了较小的Q因子对应于更好移动的惯例。6对于某些发动机,E(x)的公式并非严格正确,因为修剪了X的某些法律移动,因此定义E(x)的最小化是近似的。7一些国际象棋引擎并非真正没有记忆。例如,他们构建了评估位置的哈希表,这些位置是从一个动作到另一个游戏过程中的下一个。发动机记忆对MPC-MC性能的影响是一个尚未完全评估的复杂问题。
![arxiv:2409.06477v1 [cs.ai] 10月10日2024PDF文件第1页](/bimg/2/2c2fcbd8fc7154fd47b5bf5afebd71a5a6f11b91.webp)
![arxiv:2409.06477v1 [cs.ai] 10月10日2024PDF文件第2页](/bimg/5/5548c5b7906767298f7e096dd583b461a220a15f.webp)
![arxiv:2409.06477v1 [cs.ai] 10月10日2024PDF文件第3页](/bimg/0/0a95b22377b6191001f7de594cceabc23e564831.webp)
![arxiv:2409.06477v1 [cs.ai] 10月10日2024PDF文件第4页](/bimg/4/4a4df49d61db55a86a735fe53341d610987eaee4.webp)
![arxiv:2409.06477v1 [cs.ai] 10月10日2024PDF文件第5页](/bimg/3/31bb5753895ca08d3ee350bf1da35bc3641211c1.webp)
